S.M.A.R.T. 



S.M.A.R.T. (Self-Monitoring Analysis and Reporting Technology), que en español significa 
Tecnología de auto monitoreo, análisis y reporte, fue diseñado por IBM. Fue creado para 
monitorear el estado del disco usando varios métodos y dispositivos (sensores). Un solo disco 
duro ATA puede tener hasta 30 de tales valores medidos, a los que se le denomina atributos. 
Algunos de ellos afectan directa o indirectamente el estado de salud del disco duro y otros dan 
información estadística. 

Hoy todos los discos duros modernos IDE/Seria l-ATA/SCSI poseen la característica S.M.A.R.T. En 
realidad no es un estándar - así que el significado de los atributos puede ser diferente entre 
uno y otro fabricante. En este artículo, sólo hablaremos de discos duros ATA (IDE y Serial-ATA). 
Los discos duros SCSI trabajan distinto: el dato de predicción de falla es estándar y hay reglas 
estrictas sobre los algoritmos y sensores. Por ejemplo, la diferencia entre temperatura real y la 
medida por el sensor debiera ser menor que +/- 3 grados centígrados. 

Muchos atributos son usados por todos los fabricantes, y de la misma forma (o cercana a ella). 
Es por eso que, por ejemplo, es posible detectar la temperatura y el consumo total a tiempo en 
muchos discos duros. Las aplicaciones más recientes están habilitadas para detectar, procesar y 
mostrar toda esta información. 

De acuerdo a las especificaciones S.M.A.R.T, cuando un problema es detectado (predicción de 
falla), el disco duro debiera trabajar por al menos 24 horas para realizar un respaldo de 
información. Pero en muchos casos este tiempo no es suficiente - es por eso que es tan 
importante reconocer los problemas y estar preparado antes de que sea demasiado tarde. 

S.M.A.R.T. en acción 

El estado actual del disco duro es constantemente examinado por muchos sensores. Los 
valores medidos son entonces procesados por algunos algoritmos y los atributos 
correspondientes son modificados de acuerdo a los resultados. 

Un solo atributo S.M.A.R.T. posee los siguientes campos: 

• Identifier -Identificados (byte): el significado del atributo. Muchos atributos tienen 
significados estándar (por ejemplo, 5 = número de sectores reubicados, 194 = 
temperatura, etc.). La mayoría de las aplicaciones proveen nombre y una descripción 
textual sobre los atributos. 

• Data -Datos- (6 bytes): los valores medidos en bruto se almacenan en este campo, 
entregados por un sensor o contador. Entonces este dato es procesado por un algoritmo 



diseñado por el fabricante del disco duro. En ocasiones diferentes partes de este valor 
(por ejemplo, bajo, medio, alto 16 bits) contiene distinto tipo de información. 

• Threshold -Umbral- (byte): el valor límite (falla) para el atributo. 

• Valué -Valor- (byte): el estado de "salud" actual del atributo. Este número es calculado 
por el algoritmo, usando el dato en bruto (ver más arriba). En un disco duro nuevo, este 
número es alto (un máximo teórico, por ejemplo, 100, 200 ó 253) y disminuye durante el 
período de vida del disco. 

• Worst -Peor- (byte): el peor valor (más pequeño) encontrado en el anterior período de 

vida del disco duro. 

• Status flags -Banderas de estado-: indican el propósito principal del atributo. Un 
atributo puede ser, por ejemplo, crítico (capaz de predecir una falla) o una estadística 
(que no afecta directamente en su condición). 

Nota: El software puede desplegar más información basada en estos campos (por ejemplo, el 
estado de un atributo, el que puede ser "OK" o "Siempre OK" etc.) y puede ayudar en la 
evaluación o gestión de los atributos. 



No. 


Attribute Thre... Valué Worst Status 


Data 


Offset 




Apply 


1 


$3 


SpinUpTime 63 203 202 0K 


000000002D95 




0 


+ 


0 




Time needed by spindle to spin-up to full RPM. Indícate problem wiith motor or bearings. 














4 


Start/Stop Count 0 253 253 0K (Always passing) 


00000000025E 




0 


+ 


0 




$5 


Count of start/stop cycles of spindle. This valué does not directJy aflectlhe condrlion of the drive. 














Reallocated Sectors Count 63 253 253 0K 


000000000000 




0 


+ 


0 




Count of sectors moved to the spare área. Indícate problem with the dísk surface orine readAwrite heads. 












$6 


Read Channel Margin 100 253 253 0K 


000000000000 




0 


ffl 


0 




Margin of a channel mihile reading data. The exactfunction of fhis atlríbute is not specified. 














7 


Seek Error Rate 0 253 252 0K (Always passing) 


000000000000 




0 


+ 


0 




$8 


Rato of posf&oning errors of the readAwrfte heads. Indícate problem lAiith servo, head. High temperature can also cause this problem. 








Seek Time Performance 187 249 236 0K 


00000000EC23 




0 


+ 


0 




Average time of seek operaíons of the heads. Indícate problem with servo. 














9 


Power-On Time Count 0 195 195 0K (Always passing) 


000000009518 




0 


+ 


0 






Total time the drive is powered on. The unít of the measure depends on the manufacturer. 















Fig.l - Algunos atributos y sus detalles 



Un atributo es correcto, cuando el valor (Valué) es mayor o igual al umbral (Threshold). Si 

esto no fuera así para un atributo crítico, entonces se predice una falla, el disco duro es 
considerado defectuoso y debiera ser reemplazado inmediatamente (el atributo determina el 
problema). Los fabricantes y vendedores reemplazan el disco duro para efectos de garantía. 

La función S.M.A.R.T. en el BIOS de tarjetas madre modernas advierte al usuario en este punto 
antes de bootear el sistema operativo. Si el umbral (Threshold) es 0 para cualquier atributo, 



este último no es capaz de predecir una falla (porque el valor -Valué- no puede ser menor que 
cero). 

Matemáticamente, un atributo es perfecto si la siguiente desigualdad es VERDADERA (puedes 
saltarte este párrafo si odias las matemáticas): 

A - f(r) >= C (1) 

Donde: 

• A - Es el valor máximo teórico, el "mejor" valor posible para el atributo. 

• f - Una función para calcular la disminución basada en los valores brutos (r). 

• C - Nivel específico de umbral (Threshold) del vendedor. 

Este método tiene algunas desventajas. Los valores A, B, C (o la función f) no están definidos de 
manera exacta ( estos pueden variar de modelo a modelo incluso con dos discos duros del 
mismo fabricante). Otra desventaja es que los atributos son evaluados de forma 
independiente, la relación entre ellos es ignorada. 

Los problemas con S.M.A.R.T. 

El modelo descrito más arriba tiene muchos puntos débiles. Debido a estos problemas, en la 
mayoría de los casos la predicción de falla no funciona del todo. Los mayores problemas son: 



1. Umbrales incorrectos 

La mayoría de los problemas con S.M.A.R.T. (falta de predicción de falla) son causados por la 
selección incorrecta de los umbrales (Thresholds). Debido a esto, los atributos del disco 
duro no tienen oportunidad de alcanzar los umbrales - usualmente fallan (se convierten 
inútiles) antes de alcanzar este punto. En estos casos, S.M.A.R.T. no predice realmente la 
falla. 

En la práctica, nos podemos encontrar con valores de umbral que no son reales. Por 
ejemplo, en la mayoría de los discos duros, muchos miles de sectores en mal estado (que 
no se pueden leer o escribir) son requeridos (de acuerdo al tamaño del área disponible) 
antes de que S.M.A.R.T. muestre el problema. No parece ser un gran problema porque 1000 
de dichos sectores en mal estado toman "sólo" 512,000 bytes de datos (y esto no significa 
una pérdida de capacidad porque en su lugar se usa el área disponible), pero puede ser 
importante el cómo nacen estos sectores en mal estado, dónde están ubicados en la 
superficie y cuál es su rango de aumento. 

En la mayoría de los casos, los problemas pueden ser detectados con mucha anticipación 
antes de que un valor de atributo alcance su umbral (Threshold). Por ejemplo, un problema 
de cabezal puede dejar muchos miles de sectores inútiles (en mal estado), puede hacer que 



las partes más grandes de la superficie del disco no puedan ser leídas - previniendo la 
recuperación de datos en esta área del disco. Además, el análisis de dicha área con 
problemas y el guardado de los datos al área disponible puede necesitar mucho tiempo 
(incluso horas), y es posible que la operación no se complete sin errores. Durante este 
proceso, el sistema operativo usualmente deja de responder, así que un disco duro con 
problemas puede causar una completa inestabilidad al sistema. 



Q5 Reallocated Sectors Count 63 253 253 OK 000000000000 — 0 + 0 

Count of sectors moved to fríe spare área. Indícate problem with fríe disk surface orfrie readAwrite heads. 

Fig.2 - Va¡or=253, Umbral=63, en este disco se requieren 1900 sectores en mal estado para alcanzar el 
Umbral. Afortunadamente, en este disco, no hay tales sectores en mal estado. 



También podemos hablar sobre los valores de Umbral seleccionados de forma inapropiada. 
Algunos fabricantes de discos duros pueden definir 60-70 años o incluso más para el tiempo 
de vida total de un disco duro cuando se ha examinado el atributo correspondiente. Es 
realmente interesante - porque los fabricantes usualmente definen el tiempo de vida en 5 
años, designado en los manuales del producto. Por otra parte, S.M.A.R.T. no alertará 
cuando se alcance el final del tiempo de vida, debido a que este atributo por lo general no 
es uno crítico. 



3 Power-On Time Count 0 37 37 0K (Aiwa'. 00000021 656C — 0 + 0 
Total lime fríe drive is povuered on. The unit of fríe measune depends on fríe manufacturer. 

F¡g.3 - El Valor ha disminuido de 100 a 97 después de 759 días de uso. Cuánto tiempo 
necesitaríamos para llegar al fin del tiempo de vida especificado por el vendedor? 



Por otro lado, el valor de Umbral (Threshold) es 0 para muchos atributos críticos. Debido a 
que el Valor no puede disminuir por debajo de 0, estos atributos nunca indicarán algún 
signo de falla - incluso si "quisieran" hacerlo. Así que S.M.A.R.T. nunca alertará. 



No. 



Attribute 



Thre.. 
0 



Valué Worst Status 
253 253 OK (Always passing) 



Data 

000000000000 



000000000000 



000000000000 



^ 1 96 Reallocation E vent Count 

Courtt of sector remap operaíons. Number of all (successful and failed) remap operalions. 
^ 1 97 Current Pending Sector Count 0 253 253 OK (Always passing) 

Courtt of unstable sectors. These pending sectors may be remapped to the spare anea. 
^198 Off -Une Uncorrectable Sector Count 0 253 253 OK (Always passing) 

Count of uncorrectable errors when readingtoiriting. Indícate problem with the disk surface orthe readtoiríte heads. 

1 99 Ultra ATA CRC Error Count 0 1 99 1 98 OK (Always passing) 000000000001 
Count of errors during data transfer between disk and host. Indícate problem wurth the poiwer supply or data cable. 

200 Write Error Rale 0 253 252 OK (Always passing) 000000000000 
Errors occured while writing raw data from a disk. Indicare problem wrlh the disk surface orthe readtoirite heads. 

201 Soft Read Error Rale 0 253 249 OK (Always passing) 00000000000E 
Number of software read errors. The number of uncorreactable read emors. 

202 Data AddressMark Errors 0 253 252 OK (Always passing) 000000000000 
Number of data address mark errors. Number of incorrect or invalid address marks. 

$ 203 Run Out Cancel 180 253 252 OK 000000000004 

Number of data comedión errors. Invalid error comedión checksum found during error comedión. 



Offset 


Apply 


- 0 + 


0 




0 


- 0 + 




-|o|+ 


0 




-I 0 l+ 


0 






-I 0 |+ 


0 






- 0 + 


0 






-| 0 l+ 


0 






-I 0 |+ 


0 



Fig.4 - Atributos críticos con el Umbral 0. 

Algunas veces los atributos muy importantes no están marcados como "críticos". Ello significa 
que las aplicaciones de monitoreo del disco duro y la función S.M.A.R.T. del BIOS no examinan 
estos atributos del todo. 



2. Método de evaluación incorrecto 



La mayoría de las aplicaciones usan el método específico del vendedor, descrito más arriba, 
para calcular y mostrar la salud del disco. El resultado es que la mayoría de los discos duros 
lucen mucho mejor que su estado real. Los fabricantes de discos duros puede que incluso 
elijan Umbrales (Threshold) o algoritmos para mostrar sus discos duros mejor que otro 
disco duro de otro fabricante. Esto puede confundir tanto a las aplicaciones como a los 
usuarios. 

Los desabolladores de software sólo usan el método de evaluación dependiente del 
fabricante y no hacen nada sobre la detección del estado real de salud de los discos. Debido 
a esto, es posible que el usuario use una aplicación de monitoreo de disco duro, pero el 
disco duro falla antes de mostrar cualquier señal de problemas o incluso una disminución 
en su condición. Tales aplicaciones puede que muestren 10-20 años o más como tiempo de 
vida restante - lo cuál no deja de ser cuestionable. 

3. Peso de los atributos 

Distintos atributos afectan de forma diferente a la salud del disco. Algunos (por ejemplo, 10 
- spin retry count) son muy críticos. Un pequeño cambio en este atributo puede indicar un 
problema serio, por ejemplo que el motor o los rodamientos estén malos - pero también 
puede ocasionar este problema que la fuente de alimentación esté debilitada. 



Pata tales atributos, los fabricantes por lo general usan un valor alto de Umbral, para que 
así se pueda alcanzar relativamente fácil. Pero debido a la selección del Umbral y de la 
función f descrita más arriba en desigualdad (1), algunos problemas pueden ser ignorados 
por completo. Así que los usuarios no notarán ningún cambio en los atributos críticos. 

Otro problema es que la relación entre los atributos a menudo es ignorada. Es posible que 
dos o más valores de atributo casi lleguen a sus Umbrales - pero la falla no se predice 
debido a que ninguno alcanza dicho nivel de Umbral. 

4. Falta de realimentación 

Sin el uso de un software apropiado que sea capaz de leer la información S.M.A.R.T., el 
usuario no notará ningún problema con el disco duro, sólo cuando sea demasiado tarde. Si 
el número de sectores dañados aumenta lentamente (que el disco duro encuentre nuevos 
sectores problemáticos, que los analice y los reubique), el usuario puede que no note nada, 
especialmente si sólo está funcionando el protector de pantalla. Pero durante el proceso 
de re-ubicación, el sistema operativo parecerá estar congelado (no responde) y los usuarios 
tal vez reseteen o apaguen la computadora en ese preciso instante. Tal pérdida de energía 
no ayuda mucho al disco duro en el proceso de recuperación (se reiniciará más tarde). 

5. Temperatura, problemas con el sensor 

Sin el uso de software, puede que el usuario tampoco note una alza de temperatura en el 
disco duro. Ambas, CPU y tarjetas de video modernas poseen protección (apagado de 
emergencia) contra altas temperaturas, pero los discos duros no. Incluso peor, los discos 
duros son mucho más sensibles a las altas temperaturas que ningún otro componente 
dentro del gabinete. Es por eso que la mayoría de los fabricantes limitan la temperatura 
máxima de operación a 50-55 grados Celsius. 

La mayoría de BIOS tienen respaldo para examinar los voltajes de la fuente de alimentación, 
la velocidad de los ventiladores, temperatura de la CPU, etc. Pero no es posible examinar la 
temperatura del disco duro desde el BIOS. La función S.M.A.R.T. del BIOS no alerta si la 
temperatura del disco duro está muy alta. Así que es posible que el disco duro esté 
trabajando en un ambiente muy caliente. 

Pero es importante saber que muchos sensores de temperatura de disco duro no son muy 
exactos (en ocasiones la diferencia entre la temperatura real y la detectada puede ser de 8- 
10 grados Celsius o incluso más). Es recomendable usar un dispositivo externo (por ejemplo 
un termómetro infrarrojo) para medir la temperatura del disco duro y configurar la 
diferencia entre los valores medidos y los mostrados (calibración). Así entonces el software 
mostrará el correcto (ajustado) valor de temperatura (si esta función estuviera integrada). 

También es recomendable examinar la temperatura cuando el disco duro está en reposo 
(íd/e) y cuando está operando por un período largo. 



£ Current Temperatuie: 



15 'C 



F¡g.5 - Si la temperatura es demasiado alta o demasiado baja (en comparación con el ambiente) 
cuando se enciende la computadora, es recomendable verificar la exactitud del sensor de T°. 



6. Controladores incorrectos 

Puede que encontremos muchos controladores que no sean los ¡dóneos para el disco duro. 
Por usar tales controladores, uno o más discos duros no entregarán información S.M.A.R.T. 
conectada a dichos controladores (o tarjetas madre). Normalmente esto es independiente 
del software utilizado porque las aplicaciones generalmente usan el mismo método para 
accesar al disco duro y detectar información concerniente. Es posible que dos discos duros 
entreguen al 100% la misma información (normalmente los detalles del primero o disco 
duro MAESTRO PRIMARIO). El software puede que filtre esto y muestre información real 
(pero parcial), pero se recomienda verificar que los detalles sean los correctos (por ejemplo, 
que no se muestre el número de serie del disco duro dos o más veces). 

Usualmente, los controladores soportan un rango limitado de comandos de disco duro. Es 
por eso que algunas características no funcionan en todos los casos (por ejemplo, gestión 
de la acústica), incluso si el disco la soporta. 

Es recomendable examinar si el fabricante tiene paquetes de controladores corregidos, 
actualizados o bien actualizaciones del firmware. Estos puede que mejoren la situación. Si 
existen controladores RAID y non-RAID, es importante usar el correcto (non-RAID si no 
existe un arreglo RAID). Usando el otro paquete (el incorrecto) puede que se limiten 
algunas características, y por lo general la temperatura y el estado de salud del disco no se 
mostrarán. 

Muchas tarjetas madre o controladores de disco duro no poseen drivers 100% correctos 
para Windows Vista. Esto además puede prevenir la detección de la información del disco 
duro y predicción de falla bajo el nuevo sistema operativo. 

7. Hardware o datos incorrectos 

Esta es la extensión del problema anterior N°6. Algunos controladores de disco duro o 
tarjetas madre no entregan del todo los valores de Umbral (Threshold) de S.M.A.R.T. - o 
todos esos valores son 0. Los discos duros conectados a dichos controladores no mostrarán 
ninguna señal de falla debido a que los valores de atributo no son capaces de disminuir a un 
valor por debajo de cero. Puede también que las aplicaciones muestren una condición 
"excelente" debido a que los Valores están muy lejos del Umbral. 



s.M.A. R.T. Parameters : 
1 Raw Read Error Rate 

3 spin up Time 

4 start/stop count 

5 Reallocated Sector s Count 
7 seek Error Rate 

9 Power -on Time count 

10 spin Retry Count 

12 Drive Power cycle count 

194 HDD Temperature 

195 Hardware ECC Recovered 

197 current Pending sector count 

198 off-Line uncorrectable sector count 

199 ultra ata crc Error count 

200 write Error Rate 

202 Data Address Mark Errors 



0 

o 
o 
o 
o 
o 
o 
o 
o 
o 
o 

0 

o 
o 
o 



5 9 

98 

100 

100 

87 

93 

100 

99 

34 

59 

100 

100 

200 

100 

100 



5 3 

97 

100 

100 

60 

93 

100 

99 

52 

53 

100 

100 

199 

253 

253 



00000016FF67 
000000000000 
000000000059 
000000000000 
0000202E46C7 
000000001ACC 
000000000000 
0000000005EE 
000000000022 
00000016FF67 
000000000000 
000000000000 
00000000000A 
000000000000 
000000000000 



000F 
0003 
0032 
0033 
000F 
0032 
0013 
003 2 
0022 
001A 
0012 
0010 
003E 
0000 
0032 



Fig.6 - Todos los valores de Umbral son O - el disco duro "por siempre joven y saludable". En serio? 



También es posible que la información entregada por el controlador del disco duro no esté 
completa. Esto no afecta al estado de predicción de falla del disco duro, sin embargo alguna 
información detectada y desplegada puede que no sea la correcta. Afortunadamente esto no 
afecta ni a la temperatura ni a la salud del disco duro. Las aplicaciones más recientes verifican 
la firma ATA y los valores checksum (descritos en la página 116 de "AT Attachment - 8 
ATA/ATAPI Command Set") y despliegan una advertencia si estos valores no son los correctos. 



Los usuarios a menudo preguntan sobre qué es un "sector defectuoso", cómo nacen y qué 
pueden hacer para repararlos. Están confundidos debido a que al verificar la superficie del 
disco con un software (por ejemplo usando Windows Scandisk) este no reporta ningún 
problema o sectores dañados. 

S.M.A.R.T. constantemente está analizando la superficie del disco durante las operaciones 
normales. Si encuentra un área problemática (uno o más sectores en donde los datos son 
difíciles de leer o escribir), intenta leer los datos y copiarlos al área disponible. Entonces la 
ubicación original es marcada (internamente) como defectuosa y también todas las 
operaciones de lectura/escritura que apunten a la ubicación original, se redirigen entonces al 
área disponible. 



O ATA control byte 
O ATA checksum valué 



Valid 
Valid 



F¡g.7 - Caso ideal: el controlador y el driver entregan información correcta y confiable. 



Sectores defectuosos? 



Cuando la operación se ha completado, el área original (defectuosa) no es accesible para el 
software nunca más. Incluso reinstalar o muchas operaciones de formateo completo no 
mostrarán problemas debido a que el área original defectuosa no será usada nunca más. Es 
por eso que los programas (como por ejemplo Windows Scandisk) no encontrarán sectores 
problemáticos. Sólo la función de borrado seguro del hardware tendrá acceso a esta área 
(despejando estos sectores, incluso). 

Es por eso que, por ejemplo, el comando "format" de DOS nunca mostrará sectores 
defectuosos en los más modernos discos duros debido a la función S.M.A.R.T. (excepto si el 
área disponible está llena, sin embargo, es realmente difícil encontrar un disco duro así). 

La reubicación de sectores puede completarse con o sin errores (los discos duros están 
trabajando mucho mejor ahora comparado con modelos antiguos). Pero el procedimiento de 
reubicación puede causar una inestabilidad al sistema si tarda demasiado tiempo. 

El usuario no notaría nada sobre los pasos descritos más arriba - sólo cuando el número de 
sectores defectuosos es suficientemente alto (se ha alcanzado el nivel de Umbral) y entonces 
S.M.A.R.T. predice una posible falla. 

Solución 

Que exista una falla de disco duro sin haber ningún signo antes de la catástrofe es 
extremadamente extraño, excepto si la unidad se cae, o si existe un alto voltaje (bias) o si un 
desastre natural causa el problema. Pero estas circunstancias no pueden ser predecidas por 
S.M.A.R.T., por supuesto. Por lo general cuando nacen algunos sectores defectuosos, su 
número aumenta lentamente (tal vez puedan transcurrir semanas sin que haya alguna señal de 
nuevos problemas). En otros casos, la alta temperatura y/o algunos problemas realmente 
críticos pueden causar la muerte de la unidad. 

También es muy común que el efecto combinado de 2 o más atributos indique problemas 
distintos. Por ejemplo, si el motor del disco duro no es capaz de girar fácilmente (que necesite 
algunos reintentos) o que gire demasiado lento, puede indicar que posiblemente sea un 
problema con el mismo, o con sus rodamientos. Tales problemas han dejado rastros en los 
atributos S.M.A.R.T. correspondientes. Así que todos los cambios (incluso muy pequeños) 
pueden ser detectados. 

Es importante detectar estos signos con mucha anticipación antes de que puedan llevar a la 
falla. Es recomendable descartar por completo todo el modelo descrito más arriba e ignorar los 
valores de Umbral elegidos erróneamente (o perdidos) y evaluar sólo los números de los datos 
en bruto, para detectar la cantidad real de los distintos problemas sobre los discos duros. Es 
aconsejable también examinar la conexión que existe entre diferentes atributos. De esta forma 
se tendrá una imagen correcta sobre el estado real, y poder prepararse e incluso evitar pérdida 
de datos. 



También se recomienda elegir cómo queremos evaluar el estado del disco duro, dependiendo 
del uso real y "estrés" de estos. Por ejemplo, en el caso de un servidor, laptop o un disco duro 
con información crítica, el problema más pequeño puede ser peligroso, así que si existe alguno 
(por pequeño que sea) se debe notificar. 

Algunas aplicaciones pueden ofrecer distintos métodos de evaluación para los diferentes usos 
de los discos duros, y puede que den una descripción textual sobre la situación actual y 
consejos para mejorar la condición. Es una agradable función si el software puede crear 
alarmas pasivas (enviar e-mail, ejecutar un sonido o apagar la computadora), pero puede ser 
mejor si la aplicación es capaz de prevenir de forma activa la pérdida de datos, por ejemplo 
realizando una operación de respaldo automático si se detecta un nuevo problema. 

La aplicación Hard Disk Sentinel fue desarrollada considerando estos requerimientos. Durante 
el desarrollo, fue examinada la información S.M.A.R.T. de muchos discos duros ("failed", "not 
working") de muchos fabricantes distintos. Los métodos de evaluación fueron diseñados 
basados en la información recolectada. Es importante decir que el S.M.A.R.T. tradicional no 
predijo falla para la mayoría de estos discos duros. 

Ejemplo 



Recibimos un disco duro que no funcionaba para la recuperación de sus datos con los 

siguientes atributos S.M.A.R.T: 



ID 


Al tribute ñame 


Threshold 


Valué 


Worst 


Data 


Status flags 


Crítical? 1 


1 


Raw Read Error Rate 


50 


100 


100 


000000000000 


0O0B 


Yes 


2 


Throughput Performance 


50 


100 


100 


000000000000 


0005 




3 


Spin Up Time 


1 


100 


100 


0000000001E9 


0027 


4 


Start/Stop Count 


0 


100 


100 


000000000A5A 


0032 




5 


Reallocated Sectors Count 


50 


100 


100 


000000000015 


0033 


Yes 


7 


Seek Error Rate 


50 


100 


100 


000000000000 


000B 


Yes 


8 


Seek Time Performance 


50 


100 


100 


000000000000 


0005 


9 


Power-On Time Count 


0 


87 


87 


0000000014C1 


0032 




10 


Spin Retry Count 


30 


152 


100 


000000000000 


0033 


Yes 


12 


Drive Power Cycle Count 


0 


100 


100 


0000000009EA 


0032 




192 


Vendor-specific 


0 


100 


100 


000000000058 


0032 


193 


Load/Unload Cycle Count 


0 


73 


73 


00000004218D 


0032 




194 


HDD Temperatura 


0 


100 


100 


003B00020024 


0022 


196 


Reallocation Event Count 


0 


100 


100 


00000000000F 


0032 




197 


Current Pending Sector Count 


0 


100 


100 


000000000004 


0032 


198 


Off-Line Uncorrectable Sector Count 


0 


100 


100 


000000000000 


0030 




199 


Ultra ATA CRC Error Count 


0 


200 


200 


000000000000 


0032 


220 


Disk Shift 


0 


100 


100 


0000000000B3 


0002 




222 


Loaded Hours 


0 


95 


95 


0000000007EA 


0032 


223 


Load/Unload Retry Count 


0 


100 


100 


000000000000 


0032 




224 


Load Friction 


0 


100 


100 


000000000000 


0022 


226 


Load-ln Time 


0 


100 


100 


00000000017F 


0026 




240 


Head flying hours 


1 


100 


100 


000000000000 


0001 


Yes 



La función S.M.A.R.T. del BIOS no mostró ningún problema. De acuerdo a la tabla, los Valores 
(100 y más) están muy lejos de los límites correspondientes al Umbral. La mayoría de ellos 
(Valor = 100) todavía están en el máximo teórico. Si usáramos el método de evaluación 
tradicional (analizando los Valores y Umbrales), la condición del disco duro parece ser perfecta. 
Los Valores por debajo de 100 son causados por la edad y el uso de la unidad. Pero el tiempo 
de encendido total [Power On Time) de este disco duro es tan sólo 5313 (0xl4Cl) horas (el 
fabricante definió correctamente su tiempo de vida: el período de vida total es de 
aproximadamente 4.7 años, usando el disco a diario las 24 horas (5313/0. 13)/24/365 = 4.665 
años). Así que la unidad no es tan vieja. 

En contraste, si usamos Hard Disk Sentinel y seleccionamos el método de evaluación estricto 
(debido a que este disco duro es uno de 2.5", usado en una notebook), obtendremos un 
resultado completamente diferente. Durante la evaluación, el software examina los atributos 
importantes (incluso si no están marcados como "críticos" por el fabricante). 

La salud del disco duro (checando el campo Datos de los atributos 5, 196 y 197): 



100 x (100 - 10x6) x (100 - 30) x (100 - 4x4) = 23.52 % 



De acuerdo a este número, la salud es inquietante. Por defecto, este software podría alertar al 
usuario si el valor de salud es tan bajo como este número. Seleccionando tanto el método de 
evaluación como los niveles de alerta correctos, es posible predecir una falla con mucho 
tiempo de anticipación antes de una catástrofe. El propietario de este disco duro podría haber 
prevenido una pérdida de datos si hubiese instalado este software antes. 

Un valor bajo de salud solo, no significa necesariamente que el disco duro seguramente morirá 
en un futuro cercano (para verificar esto, se requiere un completo examen al hardware), pero 
hay una posibilidad segura de falla. El problema del disco duro descrito más arriba no puede 
ser detectado fácilmente, pero como podemos ver, hubieron algunas señales en los atributos 
S.M.A.R.T. Otros discos duros con otros problemas puede que funcionen por mucho tiempo, 
meses o años (incluso si poseen el valor de salud más bajo). Los problemas ocasionados en un 
período corto (por ejemplo, un ambiente demasiado caliente o un suministro de energía 
incorrecto) no desaparecerán. Pero después de corregir lo relacionado a esos problemas 
(usando un disipador de calor, ventilador o reemplazando la fuente de poder), el tiempo de 
vida del disco duro se puede extender. De todos modos, es recomendable examinar 
regularmente o constantemente el estado de estos discos duros y usarlos solamente como 
medio de almacenamiento de datos secundario. Los usuarios además deben asegurarse de 
que sus archivos importantes y de valor sean almacenados en otro disco duro (que posea el 
valor de "salud" más alto). 



